데이터 시각화 스터디 #1 - 데이터 시각화를 위한 기본 요소
종종 프로젝트가 커지거나 운영을 위해 현재 상태를 한눈에 보려고 할 때 대시보드를 구현하곤 했다.
지금까지 기억나는 건 한 2개의 대시보드를 개발해보았다.
내가 기억하는 대시보드는 여러 개의 차트들이 화려하게 움직이고, 실시간으로 현재 시스템에 어떤 일들이 벌어지는지 보여주는 전광판의 느낌이었다.
그럼 이러한 대시보드가 도움이 되었는가? 라고 묻는다면… 나야 모르지!
내가 쓸 게 아니었으니까. 이걸 쓰는 건 운영하시는 분들이거나 통계 관련 기획자 분들이셨으니 내가 신경 쓸 것이 아니었다.
그러다 이번에 대시보드를 만들게 되었는데, 간단한 기획적 요소들과 차트에 대한 이해가 필요하게 되어 서점에서 10권 정도의 데이터 시각화 관련 책을 훑어보았다.
그중 『대시보드 설계와 데이터 시각화』라는 책을 보게 되었고 지금 읽고 있다.
읽으면서 내가 많은 착각과 얇은 시야로 보고 있었다는 걸 느꼈고, 책에서 배운 내용을 정리한 뒤 직접 대입해볼 예정이다.

대시보드란?
대시보드는 사람들이 정의하기에 따라 달라진다.
책에서는 이렇게 정의한다.
대시보드란 상황을 모니터링하거나, 이해를 돕거나, 둘 다에 사용하는 데이터의 시각적 표현이다.
세상에 완벽한 대시보드는 존재할 수 없다.
각자 처한 상황이 다르고, 받아들이는 게 다르고, 말하는 게 다르기 때문이다.
즉, 대시보드는 특정 질문에 대해 시각적으로 잘 대답해주는 것이 핵심이다.
예를 들어 아래의 표를 보자.

한눈에 어떤 정보가 있는지 파악하기 어렵다.
하지만 아래의 차트는 어떨까?

차이를 명확히 알 수 있다.
즉, 표는 정확한 수치를 보는 데 유리하지만, 추세를 파악하기엔 차트가 훨씬 좋다.
시나리오
먼저 대시보드가 필요한 이유부터 점검해야 한다.
대시보드를 만들 땐 하고 싶은 질문이 명확해야 한다.
예시 질문들:
- 매출이 작년 대비 얼마나 변했는가?
- 프로모션을 통해 유입된 신규 유저는 몇 명인가?
- 각 지역별 후보자 선호도는?
이러한 질문에 답할 수 있는 구성과 시각화가 필요하다.
즉, 시나리오 작성을 통해 목적을 명확히 해야 한다.
시각화의 2가지 속성 - 전주의적 속성
전주의적 속성이란, 다른 값들 속에서 특정 값을 빠르게 눈에 띄게 만드는 속성을 말한다.
예시:


오른쪽 테이블에서는 ‘7’을 쉽게 찾을 수 있다.
이것이 전주의적 시각화의 효과이다.
사용할 수 있는 속성:
- 방향
- 길이
- 너비
- 크기
- 형태
- 곡률
- 표시 추가
- 둘러싸기
- 색상 / 색조
- 위치
- 공간적 그룹핑 등
하지만 이러한 속성이 많으면 오히려 혼란을 초래한다.
예:

즉, 강조하고자 하는 정보에만 최소한으로 사용해야 한다.
시각화의 2가지 속성 - 데이터 유형
데이터 유형에 따라 적절한 시각화 방식이 달라진다.
분류:
- 범주형 데이터: 상호 간 연관 없는 이름, 직업 등
- 순서형 데이터: 순서가 있는 값들 (만족도, 연봉 등)
- 정량적 데이터: 이산 또는 연속 데이터 (키, 매출 등)
예시 차트 분석:

- 나라 → 범주형 → 위치
- 사망자 → 정량적 → 길이
- 사망유형 → 범주형 → 색
- 공격 횟수 → 정량적 → 크기
결론
효과적인 대시보드를 만들려면, 장식에 집착해서는 안 된다.
중요한 것은 차트가 현재의 질문에 대해 적절한 답변을 제공하는가이다.
시각화의 본질은 의사결정을 돕는 데 있다.